Глобальное и локальное выравнивание анинокислотных последовательностей
Матрицы переходов
Глобальное выравнивание
- Матрица переходов строилась для последовательностей MIGR (первые четыре а.о. белка RUVA_ECOLI) и MMLGT (полученной из первой путем двух замен и одной вставки);
- При построении матрицы перехода использовались следующие параметры:
- Вес совпадения равен 2;
- Вес замены равен -1;
- Штраф за делецию равен -2;
- Вес оптимального пути равен 1. Полученное значение не велико, т.к. вероятность происхождения на столь коротком участке белка (4 а.о.) необходимого количества мутаций чрезвычайно мала.
- Выравнивание, соответствующее оптимальному пути:
|
|
Локальное выравнивание
|
- Матрица переходов строилась для последовательности из первых 9 аминокислотных остатков белка RUVA_ECOLI) и IGGII.
- При построении матрицы перехода использовались следующие параметры:
- Вес совпадения равен 2;
- Вес замены равен -1;
- Штраф за делецию равен -2;
- Вес оптимального пути равен 6;
- Вес субоптимального пути равен 4;
|
Оптимальное выравнивание:
GII
|||
GII
|
Субоптимальное выравнивание:
IG
||
IG
|
|
Влияние параметров на глобальное выравнивание
При построении глобального выравнивания программа NEEDLE из програмного
пакета EMBOSS учитывает аффинную систему штрафов за открытие и продолжение
делеций в выравниваемых последовательностях.
Приведенное ниже выравнивание, построенное программой NEEDLE при стандартных
параметрах цены открытия и продолжения гэпа, отражает тот случай, когда не желательны
и очень длинные, и короткие делеции.
Выравнивание строилось со следующими параметрами:
- Цена за открытие гэпа (делеции) 10;
- Цена за продолжение гэпа (делеции) 1.
|
RUVA_ECOLI 1 MIGRLRGIIIEKQPPLVLIEVGGVGYEVHMPMTCFYELPEAGQEAIVFTH 50
NEW_SEQ 1 0
RUVA_ECOLI 51 FVVREDAQLLYGFNNKQERTLFKELIKTNGVGPKLALAILSGMSAQQFVN 100
NEW_SEQ 1 0
RUVA_ECOLI 101 AVEREEVGALVKLPGIGKKTAERLIVEMKD---RFKGLHGDLFTPAADLV 147
:|..::. ||||||||||||
NEW_SEQ 1 MIGRLRGIIIRFKGLHGDLFTP 22
RUVA_ECOLI 148 LTSPASPATDDAEQEAVAALVALGYKPQEASRMVSKIARPDASSETLIRE 197
NEW_SEQ 23 22
RUVA_ECOLI 198 ALRAAL 203
NEW_SEQ 23 22
|
Второе выравнивание строилось при условии, что штаф за открытие и продолжение делеции равны, а также сам штраф гораздо меньше, чем в предыдущем
выравнивании. При задании таких параматров программа увеличивает число гэпов внутри
последовательности, чтобы увеличить число совпадений аминокислот.
Выравнивание строилось со следующими параметрами:
- Цена за открытие гэпа (делеции) 1;
- Цена за продолжение гэпа (делеции) 1.
|
RUVA_ECOLI 1 MIGRLRGIIIEKQPPLVLIEVGGVGYEVHMPMTCFYELPEAGQEAIVFTH 50
NEW_SEQ 1 0
RUVA_ECOLI 51 FVVREDAQLLYGFNNKQERTLFKELIKTNGVGPKLALAILSGMSAQQFVN 100
NEW_SEQ 1 0
RUVA_ECOLI 101 AVEREEVGALVKLPGIGKKTAERL--IVEMKDRFKGLHGDLFTPAADLVL 148
: || || |: : ||||||||||||
NEW_SEQ 1 M--IG-----RLRGII-I--RFKGLHGDLFTP 22
RUVA_ECOLI 149 TSPASPATDDAEQEAVAALVALGYKPQEASRMVSKIARPDASSETLIREA 198
NEW_SEQ 23 22
RUVA_ECOLI 199 LRAAL 203
NEW_SEQ 23 22
|
Сравнив полученные выравнивания, можно отметить, что первое оказалось более
объективным. Последовательность NEWSEQ была получена склеиванием двух небольших
участков последовательности исходного белка, а не вырезанием из нее мелких фрагментов с образованием
небольших и многочисленных делеций.
Однако следует учесть, что ни одно из них не соответствует действительности.Для того, чтобы получить реальную картину, необходимо увеличить штраф за открытие гепа и уменьшить за его продолжение.
Приведенные выравнивания позволяют оценить преимущества аффинной системы штрафов.
©
Yuminova Alina aka Melli, 2005